查看原文
其他

写给设计师的人工智能指南:图像

2017-04-02 shadow 科技Mix设计Lab

“在未来30年,

人工智能将取代目前世界上50%的工作。”

——莱斯大学 计算机科学教授 Moshe Vardi


不管未来怎么样,我觉得提高设计师的效率是眼前最容易做到的事情。


设计师打交道最多是图像,各种图案、照片、视觉设计稿,都离不开图像。而图像识别正是人工智能的典型应用之一。

所以本期选择了这一主题。


我们先看最简单的例子。

验证码的识别,属于比较简单的图像识别技术:简单的图像分类器

大致的识别过程:

1)待测试的图片灰度化并二值化

2)预先装载特征库

3)物体轮廓检测                  

4)扫描待测图片,并进行特征码比对,匹配优先


其实关键在于特征库

如果我们的特征库足够强大,那随便啥验证码都可以完美识别啦。

是不是这么说?


再看难一点的图像识别类型:

人脸识别

我们可以打开支付宝,体验下人脸识别;


我是觉得还可以,不知各位体验如何?


那么,人脸识别是什么技术呢?


1、采用的是深度学习,要了解深度学习就得去了解机器学习;


Machine Learning是一门多领域交叉学科,涉及概率论、统计学、理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。


随着这几年硬件设备的发展,机器学习的研究进展也提速了,网上也有许多的开源机器学习库,这里推荐谷歌的tensorflow


2、机器学习的算法很多,部分如下所列:


决策树

随机森林算法

逻辑回归

SVM

朴素贝叶斯

K最近邻算法

K均值算法

Adaboost 算法

神经网络

马尔可夫


选一种合适的算法很重要,为什么?

复杂的算法并不一定解决问题,得看具体的应用场景。


比如前段时间,我用了K-means聚类,对照片的颜色进行的提取,完成了我的一款app:

「 采色灵感」。有兴趣可以下载体验下ios版。


这个算法其实非常简单,把数据投射到一个坐标空间中,通过不断地取离种子点最近均值的算法。


最后,我通过它提取到了图像颜色的分类。我把它限制到了4个以内。

太多其实没多大用处,还不如打开ps用取色器,一个个像素取,对吧?


基于图像,提取特征值,我这里仅仅是进行了颜色这一特征的提取,还算比较简单。


回过头来看人脸识别,需要提取的特征值就复杂多了,主流的方法有EigenFace、FisherFace、LBPHFace三种,加上还有其他各种各样的变种方法,在opencv都有提供。

眼睛、鼻子、嘴巴。。不是这么好识别的,不过,作为设计师我们可以了解图像识别的基本技术路线:


结合大量公开和独有的训练数据集,在超级计算机上学习并提取照片特征,实现高效准确的标定和识别。


记住,一定要大量,只有保证训练数据的大量,才有可能得出相对准确的模型。


这里,如果有兴趣,我们可以用开源的技术框架,进行图像识别的实验。

OpenCV ,包含从底层的图像颜色空间转换到高层的机器学习工具。

可以尝试的项目:


1、做特征匹配,当下最常用和前沿的“以图搜图”的实现方法


2、做人脸对齐,人脸识别和人脸中的五官识别


3、实现监控视频的
行人识别与跟踪


关于人脸识别这块,还可以试试科大讯飞的开放平台提供的服务,提供一张图像,科大讯飞返回一张坐标。至于可以有哪些具体应用,设计师们可以创作下~


这里我找到了相关的图像识别的应用案例


深绘。机器够识别图片中的人物主题和服装,读懂图片中的模特框架、动作、姿态甚至是着装的效果,然后根据不同的需求来裁剪图片以配合不同模板、屏幕的需求。同时帮助商家完成设计、排版、上架等一系列的工作,而且最快只需要几分钟就可以全部搞定。

深绘的技术类似于人脸识别相关技术,只是应用在服装模特照片上。深绘,采用的应该是大量的服装训练集,把模特的动作、姿态、着装效果等进行标记,进行机器学习。期间要用到图像识别、机器学习等相关技术。


tensorflow的相关开源项目

源代码开源哦,想怎么改都行,而且可以跟着作者的思路实现下。


图像描述,即看图说话。image caption:

基于MNIST数据集的手写数字识别,其中最广为人知的example。

这一期就这样吧。


下一期我有可能会更新的主题:

1、聊天机器人的技术;

2、人工智能助理;

3、用人工智能来完成艺术创作,如写作、作诗、谱曲、画画等。


人工智能相关文章:

Javascript也可以玩机器学习

《机器学习》入门的26个概念。笔记1




欢迎长按二维码

关注本号

本号发布内容主要为设计&科技方面



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存